max rank | avg. rank | sentence |
---|---|---|
80 | 33.8824 | Han säger bara att så här ska det inte vara – men det är så här, säger hon. |
193 | 57.0000 | Det är det som gör oss till människor. |
200 | 64.7500 | Det handlar bara om några år ”, säger han. |
212 | 54.6667 | Det är så de skriver också, visar det sig. |
213 | 106.1250 | Man behöver ju inte göra något, säger hon. |
213 | 82.0769 | Man vet vad man får och man vet att man har det kvar. |
223 | 87.7857 | När jag har gjort så där mycket, då måste jag vara ännu bättre sedan. |
239 | 61.8182 | I väldigt många fall så är det inte så, säger han. |
245 | 88.0000 | Men från dag ett har jag alltid varit mig själv. |
251 | 109.0909 | När han väl är tillbaka kommer de bara bli ännu bättre. |
257 | 78.7778 | Det här är ändå något som inte är klart. |
257 | 108.1111 | Det var klart fler i år än förra året. |
268 | 86.4444 | Så gör vi den här veckan också, säger hon. |
269 | 59.7273 | Vad säger du om att det ser ut så här då? |
274 | 107.1111 | Jag är fortfarande på väg bort och mot något. |
278 | 85.5556 | Det är bättre här i Sverige måste jag säga. |
278 | 93.3636 | Hur många som kommer att göra det är svårt att säga. |
278 | 102.0000 | "Jag vill inte säga något innan det är klart" |
278 | 84.7000 | Men något måste den göra och något måste den säga. |
281 | 104.6667 | För andra gången på fyra år i så fall. |
282 | 95.0000 | Det är lika många som Sverige har tagit emot i år. |
285 | 73.1250 | Det var riktigt bra, för två år sedan. |
290 | 70.2222 | Det har blivit ett problem det här, säger han. |
295 | 79.3333 | Sedan är det inget som säger att det är rätt, men vi i den här kommunen tycker att det är riktigt. |
299 | 124.8571 | För många på samma gång håller inte. |
299 | 62.0000 | Jag håller inte med om något av det där. |
300 | 92.2222 | Nu är det alltså över för den här gången. |
300 | 111.0000 | Och jag är inte det, alltså i min grund. |
311 | 69.9000 | Det är därför vi är där vi är just nu. |
312 | 57.3889 | Då var vi i och för sig inte hemma hos så många som vi var nu, säger han. |
The maximum word rank of a sentence is by definition the rank of the rarest word in the sentence. If it is low, all words in the sentence are of high frequency. For this reason the table of the sentences with least maximum word number might be of interest. In the table, we see the corresponding sentences with a minimum length of 40 characters.
The over all distribution of the maximum rank in all sentences of the corpus is shown in a diagram with log-scaled x-axis.
The sentences in the table described above are of interest because they are usually easy to understand. The distribution may give insights into the corpus and may give parameters for language comparison.
While the distribution might be deduced from a small corpus, the sentences in the table are rare and a large corpus will give more impressive results.
Table data:
select max(w_id)-100 as m, avg(w_id)-100 as a, s.sentence from sentences s, inv_w i where s.s_id=i.s_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by m limit 30;
Distribution data;
select m, count(*) from (select 100* round((max(w_id)-100)/100) as m from sentences s, inv_w i where s.s_id=i.s_id and i.w_id>100 group by s.s_id) aa group by m;
Explain the distribution, especially the increase in its right part.
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.7 Sentences consisting of long words only I
4.5.2.8 Sentences consisting of long words only II